Model Selection

Memory efficient

# Memory efficient

Gemma 3 1b It Fast GUFF

Quantized version optimized for low-end hardware and CPU-only environments, achieving production-ready inference configurations under resource constraints

Large Language Model

Llama 3.2 3B Instruct GGUF

Llama-3.2-3B-Instruct GGUF is a 3B-parameter large language model released by Meta, utilizing IQ-DynamicGate technology for ultra-low-bit quantization (1-2 bits), optimizing inference performance while maintaining memory efficiency.

Large Language Model Supports Multiple Languages

Llama 3 3 Nemotron Super 49B V1 GGUF

A 49B-parameter large language model utilizing IQ-DynamicGate ultra-low-bit quantization technology, supporting 1-2 bit precision-adaptive quantization, optimized for memory efficiency and inference speed

Large Language Model English

RuLeanALBERT is a memory-efficient masked language model pretrained specifically for Russian.

Large Language Model

Transformers Other

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase